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摘 要 : 


[目的 /意义 ] 对 国内 外 新 兴 技 术 识 别 方法 进行 系统 梳理 ,总 结 研究 现状 ,分 析 存 在 问题 ,为 今后 新 兴 技 术 识 别 方法 
的 研究 提供 参考 。|[ 方法 “过程 ] 在 文献 调研 与 计量 分 析 的 基础 上 ,归纳 总 结 目前 主流 的 新 兴 技 术 识别 方法 ,结合 
典型 案例 分 析 各 类 方法 的 特征 及 其 在 新 兴 技 术 识别 过 程 中 的 优 缺点 ,并 为 未 来 新 兴 技 术 识别 方法 研究 提出 建议 。 
[ 结果 /结论 ] 目前 的 新 兴 技 术 识 别 方法 既 有 定量 的 ,也 有 定性 的 ,常见 的 方法 包括 基于 测度 模型 文献 计量 以 及 文 
本 挖 握 的 方法 , 且 越 来 越 倾向 于 多 方法 融合 应 用 ,不 过 现 有 研究 仍然 存在 一 些 不 足 。 未 来 对 新 兴 技 术 识 别 方法 的 
研究 应 该 加 强 对 新 兴 技 术 本 质 特 征 的 探究 ,加 强 具体 识别 方法 对 新 兴 技 术 的 解释 意义 ,以 及 从 数据 源 、 识 别 方法 
两 方面 共同 提升 新 兴 技 术 识别 的 时 效 性 ;同时 ,还 应 该 加 强 对 新 兴 技 术 识 别 中 多 源 数据 有 效 融合 与 应 用 方法 的 
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al 演变 的 速度 和 复杂 性 不 断 提升 以 及 技术 
之 国 的 交叉 性 ,相互 依赖 性 的 增强 ,从 众多 新 技术 中 快 
遂 说 别 出 具 有 较 大 发 展 潜力 的 新 兴 技术 的 难度 也 在 不 
断 手 升 ,因此 近年 来 关于 新 兴 技术 的 识别 预测 成 为 相 
TORI TIL H LITER EL 
关于 新 兴 技 术 的 定义 及 其 特征 学 界 一 直 没有 达成 
目前 最 广泛 认可 的 定义 是 宾夕法尼亚 大 学 沃 屯 
Tes be te 2000 年 出 版 的 著作 Wharton on Managing E- 
merging Technologies 中 给 出 的 定义 一 一 新 兴 技术 是 建 
立 在 科学 基础 上 的 创新 性 技术 ,它们 可 能 创立 一 个 新 
行业 或 改变 某 个 老 行业 "。 关 于 新 兴 技 术 的 特征 ,最 
广泛 认可 的 是 D，Rotolo 等 中 提出 的 新 颖 性 、 相 对 快速 
的 增长 .一致 性 .突出 的 影响 以 及 不 确定 性 。 而 对 于 新 
兴 技 术 的 识别 ,学 者 们 在 具体 操作 中 通常 主要 考虑 新 
兴 技 术 的 “新 "与 “ 兴 ”, 即 新 颖 性 和 相对 快速 的 发 展 。 
从 国家 层面 来 讲 , 加 强 新 兴 技 术 识别 有 助 于 整体 
科研 布局 优化 以 及 做 好 长 期 规划 ;从 企业 层面 来 讲 ,加 
强 新 兴 技 术 识别 有 助 于 确定 研发 重点 ,投资 方向 以 及 
降低 投资 风险 。 同 时 ,新 兴 技 术 识 别 是 研究 前 沿 技术 、 
突破 性 技术 ,颠覆 性 技术 等 的 基础 与 前 提 , 一 些 新 兴 技 


术 可 能 就 是 前 沿 技术 ,也 可 能 发 展 成 为 突破 性 技术 或 
颠覆 性 技术 。 加 强 新 兴 技 术 的 识别 与 预测 方法 研究 ， 
不 断 提升 对 各 领域 新 兴 技 术 识 别 与 预测 的 准确 性 和 效 
率 ,具有 十 分 重要 的 战略 与 现实 意义 。 正 是 基于 对 此 
问题 的 深刻 理解 ,笔者 拟 在 对 国内 外 当前 常用 的 新 兴 
技术 识别 方法 进行 深入 系统 调研 的 基础 上 ,对 这 些 常 
见识 别 方 法 进行 分 类 分 析 , 以 期 为 后 续 研 究 提 供 参 考 。 

为 了 综观 新 兴 技 术 识 别 预测 方法 研究 总 体态 势 并 
基于 核心 论文 进行 分 类 分 析 , 笔 者 选取 Web of Science 
和 中 国 知 网 作为 数据 源 。Web of Science 检索 策略 为 : 


TS =((identif * or forecast * or discover * or detect * 


or predict * or assess * or evaluat * or anticipat * or de- 
mystif * or measur * ) and (“emerg * technolog * ”or 
“technolog * emerg * ” or “emerg * topic * ” or “ techn- 
olog * potential” )) ,索引 = (SCI-EXPANDED, SSCI, 
CPCI-S ) ,时 间 跨 度 = 所 有 年 份 , 共 检 索 到 相关 文献 
9 608 篇 。 中 国 知 网 检索 策略 为 :SU = ( 新兴 技术 ”+ 
“新 兴 主 题 " + “技术 潜力 ) AND SU = (“识别 ”+“ 预 
MN? + “测度 ”+ “发 现 ”+ “评估 ”+“ 评 价 ” +“ 探 
W), KEKI = 全 部 期 刊 ,发 表 时 间 = 不 限 , 共 检索 
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到 相关 论文 203 篇 (检索 时 间 :2019 年 7 月 16 日 )。 通 
过 对 检索 到 的 文献 进行 基本 指标 的 计量 分 析 , 了 解 了 
该 主题 领域 研究 截止 目前 的 基本 态势 ,在 此 基础 上 基 
于 一 些 影 响 力 指标 的 分 析 和 人 工 判读 ,以 及 对 重要 文 


要 期 刊 包 括 Technological Forecasting And Social 
Change „Scientometrics 《情报 杂志 》《 情 报 理 论 与 实践 》 
以 及 《情报 学 报 》 等 。 著 名 的 学 者 包括 A. L. Porter,P. 
Shapira、J.Youtie . 黄 鲁 成 、 吴 菲菲 \ 周 源 等 。 如 图 1 所 


献 的 参考 文献 的 补充 追踪 ,选取 能 够 表征 该 领域 研究 
历程 且 影 响 力 较 高 的 论文 ,以 及 相关 度 高 且 能 够 反映 
最 新 研究 进展 的 论文 作为 核心 文献 ,共计 55 篇 (其 中 
英文 文献 38 篇 .中文 文 献 17 篇 ) 。 笔 者 针对 新 兴 技 术 
识别 方法 的 分 类 分 析 主 要 基于 这 些 核心 文献 展开 。 


1 新 兴 技 术 识 别 方法 研究 总 体态 势 


国内 外 关于 新 兴 技 术 识 别 预测 方法 的 研究 从 20 
世纪 80 年 代 就 已 开始 ,此 后 年 度 论文 产 出 量 、 参 与 的 
古诗 机 构 数 量 及 人 研究 人 员 数 量 在 1995 年 后 开始 逐渐 

,2010 年 后 进入 快速 增长 期 。 从 涉及 的 学 科 领 域 
看 \ 国 内 发 表 相 关 论 文 最 多 的 学 科 是 工商 管理 .数量 经 
3 BB 情报 档案 学 以 及 科学 学 与 科技 管理 ,国外 文 


= 
学 < 出 学 以 及 其 他 部 分 自然 科学 领域 。 发 文 较 多 的 主 


7N: 


e 
= 
w 
i=) 
© 
(= 


1985 1990 1995 2000 2005 2010 2015 2020 
年 份 
一 一 论文 (篇 ) 一 一 机 构 (个 ) ”一 @ 一 研究 人 员 CA) 


图 1 全 球 新 兴 技 术 识 别 预 测 领 域 研究 发 展 趋势 


新 兴 技 术 识别 预测 方法 研究 涉及 的 核心 关键 词 包 
括 : 文 献计 量 专利 分 析 、 机 器 学 习 、 数 据 挖 气 \ 文 本 控 
掘 、 大 数据 .引文 网 络 社会 网 络 分 析 、 内 容 分 析 、 主 题 
探测 .模型 技术 路 线 图 、 肾 类 ,分 类 等 。 如 图 2 所 示 : 
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图 2 1985 -2019 年 新 兴 技 术 识别 预测 方法 研究 的 关键 词 聚 类 结果 


新 兴 技术 识别 预测 方法 研究 关键 词 年 度 分 布 如 表 
1 所 示 。 在 新 兴 技 术 识 别 预 测 中 ,文献 计量 方法 的 应 
用 比例 最 高 ,机 器 学 习 近 年 来 发 展 最 为 迅速 , 近 5 年 深 
度 学 习 方法 开始 越 来 越 多 地 应 用 于 新 兴 技 术 识别 预 
测 。 

从 以 上 分 析 中 可 以 看 出 ,近年 来 新 兴 技术 识别 巴 


测 方 法 的 研究 热度 不 断 上 升 , 且 受 到 较 多 领域 的 广泛 
关注 ;同时 ,机 融 学 习 、 文 本 挖掘 等 方法 在 其 中 的 应 用 
近 几 年 发 展 尤为 迅速 。 而 新 兴 技 术 识别 是 整个 新 兴 
术 预 测 领域 中 最 为 关键 的 部 分 ,只 有 实现 对 新 兴 技 术 
的 早期 识别 ,才能 进行 后 续 的 对 新 兴 技 术 未 来 发 展 目 
标 、 可 能 途径 及 资源 条 件 等 的 预测 及 评估 。 
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EA, RAF. 新 兴 技 术 识别 方法 研究 综述 [J]. 图 书 情报 工作 ,2020,64(4) :125 - 135. 


表 1 新 兴 技 术 识别 预测 方法 研究 关键 词 年 度 分 布 


年 份 


1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 


关键 词 
文献 计量 2 4 6 4 8 6 10 8 B 14 12 17 19 
专利 分 析 1 1 3 3 4 2 1 3 7 11 8 14 9 
网 络 分 析 1 1 4 2 6 4 7 4 9 9 B B 
内 容 分 析 1 1 1 2 4 2 2 3 7 2 10 6 
数据 挖掘 1 1 1 3 2 1 1 4 2 2 3 4 6 6 8 8 10 12 18 H 
文本 控 气 1 1 1 2 3 1 1 3 6 2 4 6 5 15 8 
机 器 学 习 5 Z. ü 2 7 8 10 20 30 
深度 学 习 1 2 9 12 


2 _ 常 见 的 新 兴 技术 识别 方法 分 析 


> 


兴 技 术 识 别 的 准确 性 和 效率 ,近年 来 许多 学 者 都 积极 
投入 这 方面 研究 并 取得 了 很 好 的 进展 。 例 如 , 黄 鲁 成 


| 达 从 广义 概念 来 讲 ,新 兴 技 术 识别 是 技术 预测 的 
代 友 类 。 技 术 预 测 是 对 未 来 某 个 时 间 特 定 技术 本 身 的 
PERR 特征 和 影响 进行 的 预先 测定 ' ;而 “识别 "是 基 
也 下 有 事实 进行 的 分 类 或 定性 “新 兴 技 术 识别 " 则 是 
基于 现 有 相关 数据 中 的 信号 判定 哪些 技术 是 新 兴 技 
各 其 术 顶 见 是 对 技术 发 展 及 其 与 社会 和 环境 相互 作 
采风 长 期 未 来 前 景 进行 描绘 的 系统 过 程 ” 。 

之 从 相关 研究 文献 梳理 中 可 以 发 现 ,德尔 菲 法、 情景 
分 新 法 .技术 路 线 图 法 .文献 计量 法 ,测度 模型 法 等 是 
技术 项 测 领域 较 常 用 的 方法 ,其 中 ,德尔 非法 .情景 分 
DRR 技术 路 线 图 法 等 更 多 见于 技术 预见 活动 (如 日 本 
ORG A 20 世纪 70 年 代 以 来 每 5 年 一 次 的 大 型 技术 预 


WASTES) ,而 这 些 方法 着 用 于 新 兴 技术 识别 , 则 常常 需 
要 时 文献 计量 文本 挖掘 等 定量 方法 相 结合 。 

近年 来 ,新 兴 技术 识别 领域 发 展 较 快 的 主要 是 基 
于 测度 模型 文献 计量 文本 挖掘 的 分 析 方法 以 及 这 些 
方法 的 融合 应 用 ,而 且 各 类 方法 似乎 各 有 优势 ,当然 也 
分 别 存 在 一 些 需要 改进 的 方面 。 
2.1 ”基于 测度 模型 的 新 兴 技 术 识别 方法 

许多 学 者 会 考虑 新 兴 技 术 的 识别 标准 ,从 而 选取 
相关 指标 ,构建 相应 的 测度 模型 对 新 兴 技 术 进行 识别 。 
基于 测度 模型 的 新 兴 技 术 识别 方法 的 出 现 对 整个 新 兴 
技术 识别 方法 论 体 系 的 完善 产生 了 重要 影响 ,说 明 新 
兴 技 术 识别 方法 开始 逐渐 考虑 新 兴 技 术 的 内 核 ,并 将 
识别 流程 模式 化 以 更 便捷 地 应 用 于 新 兴 技术 识别 。 从 
本 质 上 来 讲 ,基于 一 定 的 指标 体系 构建 模型 进行 新 兴 
技术 识别 的 方法 在 科学 性 方面 已 经 有 了 很 大 的 改进 ， 
通过 不 断 改进 指标 的 赋值 和 计算 办 法 可 以 促进 提高 新 


等 “从 新 兴 技 术 特征 出 发 ,在 属性 集 和 属性 测度 理论 
基础 上 提出 了 属性 综合 评价 和 决策 系统 ,构建 了 新 兴 
技术 识别 指标 体系 模型 ,包括 技术 指标 和 市 场 指 标 两 
类 指标 ,其 中 技术 类 指标 又 包括 技术 先进 性 .技术 独特 
性 ,技术 复杂 性 ,研发 投入 研发 产 出 、 形 成 技术 标准 可 
靠 性 6 个 二 级 指标 ,市 场 类 指标 又 包括 市 场 规 模 - 前 
景 市场 增 长 速度 改变 市 场 格局 的 可 能 性 和 为 客户 创 
造价 值 4 个 二 级 指标 ,并 利用 构建 的 模型 从 10 项 新 材 
料 技术 中 识别 出 1 项 新 兴 技 术 、4 项 新 技术 .3 项 一 般 
技术 ;该 方法 有 效 地 克服 了 以 往 方法 中 专家 打分 的 主 
观 随 意 性 , 保证 了 新 兴 技 术 识 别 的 科学 性 、 客 观 性 和 
准确 性 ,但 是 有 些 指标 的 可 计算 性 和 取 值 办 法 的 科学 
合理 性 还 有 待 商 榨 。 任 知 军 等 ”融合 频 度 \ 年 数 .归属 
度 等 内 容 性 指标 以 及 增长 率 、 相 对 增长 率 、 作 者 占有 率 
等 趋势 性 指标 构建 特征 向 量 ,将 LDA 主题 模型 识别 的 
技术 主题 与 Gartner 的 新 兴 技 术 主 题 通过 特征 向 量 计 
算 相 似 度 ,最 终 从 1 000 个 技术 主题 中 识别 出 了 25 个 
相似 度 最 高 的 技术 主题 作为 新 兴 技 术 。 类 似 的 ,还 有 
M. N. Kyebambe 等 “的 研究 ,其 认为 新 兴 技 术 的 踪迹 
可 以 在 其 完全 出 现 前 几 年 在 专利 数据 库 中 找到 ,因此 
研究 了 过 去 某 个 特定 时 间 点 后 催生 了 一 项 新 兴 技 术 的 
一 系列 专利 所 具有 的 特性 ,包括 专利 权 项 数 . 引 用 次 
数 、 对 非 专 利文 献 的 引用 次 数 、 技 术 生 命 周 期 .被 引 技 
术 相 似 度 以 及 被 引 专 利 受 让 人 相似 度 ,并 以 这 些 特征 
为 每 个 专利 创建 专利 特征 向 量 并 构建 模型 ,通过 聚 类 
形成 不 同 技术 集群 ,训练 模型 将 专利 集群 标记 为 新 兴 
技术 或 非 新 兴 技 术 ; 但 是 ,由 于 在 该 研究 中 仅 使 用 7 个 
特性 来 区 分 技术 集群 ,使 得 技术 集群 类 别 不 够 细 化 , 包 
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含 技术 范围 较 广 , 即 模型 识别 新 兴 技术 的 敏感 度 不 够 
高 ,因此 未 来 可 能 需要 增加 更 多 的 有 效 特征 因子 以 提 
高 模型 的 准确 度 。K，Song 等 ”首先 从 专利 耦合 网 络 
中 通过 专利 内 容 相似 性 进行 聚 类 , 找 出 离 群 专利 ,并 从 
中 识别 出 最 近 发 表 的 且 与 现 有 专利 几乎 没有 相似 之 处 
的 专利 作为 候选 新 兴 技术 ,之 后 通过 专利 权 范围 专利 
应 用 范围 .专利 发 明 者 数量 等 技术 特征 指标 以 及 市 场 
需求 等 市 场 特征 指标 构建 模型 识别 出 真正 具有 发 展 潜 
力 的 新 兴 技术 ;但 是 ,由 于 该 研究 中 提出 的 市 场 特征 指 
标 是 基于 客户 评价 数据 进行 分 析 , 因 此 只 适用 于 客户 
评价 数量 积累 到 足够 提供 可 靠 的 市 场 需求 信息 的 领 
域 ,具有 一 定 的 局 限 性 。Q，Wang 等 中 认为 新 兴 技 术 
识别 指标 体系 应 该 与 新 兴 技术 定义 高 度 吻 合 ,因此 他 
其 下 新 兴 技术 特征 提出 了 新 兴 技 术 主题 的 识别 标 
准 一 一 新 颖 性 、 相 对 快速 的 增长 .科学 影响 力 和 一 至 
性 ; 济 将 其 通过 文献 计量 指标 量化 后 构建 模型 用 以 识 
SEA 
SOS RT EP ae EB BAR BU I 
涛 是 近 几 年 发 展 起 来 并 且 应 用 较 广 泛 的 方法 ,此 类 方 
法 现 主 要 问题 在 于 指标 选取 的 科学 性 及 合理 性 难以 界 
管 闭 个 指标 的 表征 力 判 定 . 权 重 确定 以 及 模型 构建 方 
面 午 还 有 许多 值得 探讨 的 问题 需要 解决 ,另外 有 些 指 
标 移 取 值 办 法 和 计算 方法 也 是 现实 中 常常 令 人 头痛 的 
问题 。 而且, 由 于 目前 新 兴 技 术 的 定义 及 其 特征 并 没 
有 电 一 的 结论 ,因此 基于 其 内 核 特征 及 定义 的 模型 构 


建 季 较 容易 引起 争议 。 


2 友基 于 文献 计量 学 的 新 兴 技术 识别 方法 

“近年 来 , 随 着 各 类 文献 计量 软件 的 快速 发 展 ,基于 
文献 计量 学 的 方法 在 新 兴 技 术 识别 方面 的 应 用 越 来 越 
广泛 。 基 础 研究 是 创新 的 源头 ,科学 文献 中 往往 蕴含 
着 丰富 的 技术 创新 信息 ,基于 科学 文献 (包括 论文 E 
利 等 ) 在 一 定 程度 上 可 以 探测 出 人 类 技术 创新 与 发 展 
的 脉络 。 正 是 在 这 种 思想 指导 下 ,基于 文献 计量 学 的 
方法 在 新 兴 技 术 识别 中 日 益 得 到 重视 和 应 用 。 
2.2.1 基于 科学 论文 数据 的 新 兴 技 术 识 别 方法 

科学 论文 数据 用 于 新 兴 技 术 识别 可 以 在 技术 开发 
周期 的 早期 捕获 其 动向 信息 ,但 也 正 因为 其 还 在 基础 
研究 阶段 ,单独 使 用 科学 论文 数据 很 难 识别 出 真正 意 
义 上 的 “新 兴 技 术 ” ,而 更 多 的 是 识别 新 兴 主 题 和 新 兴 


基础 研究 领域 更 持久 的 创新 支持 和 新 知识 供给 的 考 
察 , 亦 即 研判 该 技术 主题 持续 创新 的 潜力 与 发 展 趋势 。 
因此 ,基于 科学 论文 的 计量 分 析 对 于 发 现 与 识别 新 兴 
技术 也 是 很 重要 的 一 种 方式 。 

首先 ,不 得 不 提 的 是 传统 的 文献 计量 指标 在 基于 
科学 论文 数据 的 新 兴 技 术 识 别 中 的 应 用 。 例 如 ,C. 
Mund 等 "选取 了 5 个 不 同 的 领域 ,通过 期 刊 规模 、 期 
刊 年 龄 .参考 文献 年 龄 ,作者 数量 、 作 者 合作 情况 等 文 
献计 量 指标 计算 识别 各 领域 的 新 兴 技 术 主 题 ,并 对 这 
些 指标 在 不 同 领域 识别 新 兴 技 术 主 题 的 效果 差异 进行 
了 对 比分 析 , 结 果 表 明 :不 同 指标 对 不 同 领域 的 新 兴 
术 识 别 效 果 差 异 较为 显著 。 比 如 ， 研 究 团队 规模 ” 指 
标 在 识别 医学 领域 新 兴 技 术 时 具有 更 高 的 辨识 度 , 而 
“期 刊 规模 ”和 “期 刊 年 龄 ”在 识别 工程 领域 新 兴 技 术 
时 具有 更 高 的 辨识 度 。 

除 传统 的 文献 计量 指标 以 外 ,有 一 些 学 者 也 会 设 
置 一 些 创 新 性 的 计量 指标 并 结合 其 他 方法 识别 新 兴 
术 。 例 如 ,E，Schiebel 等 "基于 文献 过 小指 标 ( 高 扩 
BUE 低 扩 散 度 、. 相 对 频率 等 ) 筛选 光电 子 器 件 领域 各 
研究 阶段 重要 术语 ,构建 出 了 领域 术语 演化 的 扩散 模 
型 ,并 结合 历时 聚 类 分 析 ( diachronic cluster analysis ) 来 
识别 领域 新 兴 技 术 主 题 。 


基于 科学 论文 数据 的 新 兴 技 术 识别 通常 还 会 采用 
论文 的 直接 引用 网 络 . 共 引 网 络 .耦合 网 络 等 等 中 的 


种 或 几 种 进行 聚 类 分 析 。 例 如 ,K. Fujita 等 ”在 3 种 
引文 网 络 ( 直 引 、 共 引 、 耦 合 网 络 ) 中 对 文献 聚 类 后 , 通 
过 计算 簇 团 文献 规模 、 艇 团 中 文献 的 平均 出 版 年 份 、 簇 
团 中 文献 的 文本 相似 性 及 簇 团 的 密度 ,评估 3 种 加 权 
引文 网 络 在 不 同 领 域 识别 新 兴 技 术 的 效果 ,并 结合 氮 
化 纳米 矶 两 个 搁 术 领域 进行 了 实证 研究 ,发 现 加 权 
引文 网 络 比 非 加 权 引 文 网 络 在 检测 新 兴 研 究 前 沿 方面 
更 有 用 ,并 且 以 引用 频次 作为 权重 检测 新 兴 研 究 前 沿 
比 以 发 表 年 份 差异 .文献 相似 性 ,关键 词 相似 性 等 作为 
权重 更 为 有 效 。H. Smal 基于 直接 引用 和 共同 引用 
网 络 ,结合 使 用 差异 函数 入选 出 新 兴 技 术 主 题 ,通过 搜 
索 与 该 主题 或 其 主要 研究 人 员 相 关 的 近期 主要 成 果 来 
评 佑 新兴 技术 主题 ,生成 新 兴 技 术 主 题 清单 供 决策 者 
决策 。 在 新 兴 技 术 识 别 中 使 用 最 为 广泛 的 引文 网 络 就 
是 共 引 网 络 ,但 是 共 引 网 络 生 成 时 以 论文 共 被 引 为 


研究 领域 。 但 是 ,在 基于 技术 全 生命 周期 的 识别 预测 
中 其 可 以 作为 针对 相关 技术 主题 基础 研究 阶段 发 展 态 
势 的 分 析 , 并 可 以 作为 对 相关 技术 研发 是 否 可 以 获得 


依据 ,因此 可 能 会 忽略 一 些 最 新 的 文献 ,这 会 在 一 定 程 
度 上 影响 新 兴 技术 识别 的 有 效 性 和 准确 性 。 
一 些 学 者 为 了 有 效 减少 论文 时 沸 性 对 新 兴 技术 识 
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别 的 影响 ,因此 选择 会 议论 文 作 为 新 兴 技 术 识别 的 数 
据 源 , 其 中 包括 T，Furukawa ” 、 王 燕 月 ”等 学 者 。 而 
在 某 些 学 科 领 域 ( 如 计算 机 科学 等 ) ,会 议论 文本 来 就 
是 最 为 重要 的 数据 源 ,应 该 作为 新 兴 技术 识别 的 首先 
数据 源 。 王 燕 鹏 等 "5 将 关键 技术 分 为 热点 技术 共性 
技术 以 及 新 兴 技 术 , 并 选择 人 工 智 能 领域 高 水 平 国际 
会 议论 文 作为 数据 源 ,通过 Sci2 tool 工具 的 Burst De- 
tection 算法 检测 突现 词 ,识别 出 人 工 智 能 领域 的 15 项 
新 兴 技 术 。J Kleinberg“ F 2002 年 提出 的 Burst De- 
tection 算法 在 新 兴 技术 识别 中 有 较为 广泛 的 运用 ,该 
算法 被 般 入 许多 计量 工具 ,如 Citespace、Sci2 以 及 
Workbench “, C. M. Chen ™! H. Guo!" 等 学 者 也 曾 
采用 关键 词 突现 检测 的 方法 识别 新 兴 科 技 主题 ,但 是 
仅仅 依靠 突现 检测 识别 新 兴 技 术 可 能 缺乏 准确 性 及 有 
效 性 ,应 当 适 当 结合 其 他 指标 以 及 权重 设置 等 进行 识 
JD. 
SARI, REPRE TE E ET ETE 
SOUERRE RAT E AAK DLS ANERE 
BA HARER AER NERMAN 
ATA E — M BER ERK I EE EL, 
其 训 别 结果 本 质 上 是 未 考虑 技术 性 能 与 市 场 的 切合 度 
以 颈 未 来 应 用 前 景 还 不 明朗 的 新 兴 技 术 , 这 也 是 仅 使 
用 笠 学 论文 作为 数据 源 识别 新 兴 技 术 的 一 个 局 限 性 。 
拳 琴 由 于 传统 的 文献 计量 学 涉及 到 的 计量 指标 有 限 ， 
因 嘴 应 用 于 新 兴 技术 识别 时 需要 与 其 他 方法 相 结合 j 
且 痊 具体 指标 上 要 有 更 进一步 的 个 性 化 的 创新 ,如 开 
Sehiebel 等 "提出 的 用 于 构建 术语 扩散 模型 的 扩散 度 
等 措 标 。 
2.2.2 ”基于 专利 数据 的 新 兴 技 术 识别 方法 

A. Pilkington52 早 在 2004 年 就 开始 探索 专利 作为 
描绘 技术 发 展 的 信息 来 源 的 潜力 ,认为 专利 在 预测 技 
术 商 业 化 前 景 及 新 兴 技 术 方面 的 价值 有 待 开发 。 这 是 
因为 专利 是 技术 信息 的 载体 , 相 比 于 论文 数据 更 能 
映 技术 层面 的 发 展 ,由 此 基于 专利 数据 的 文献 计量 方 
法 也 成 为 文献 计量 学 在 新 兴 技 术 识别 的 应 用 中 最 主要 
的 部 分 ,相关 文献 较 多 , 且 近 年 来 数量 上 升 极 快 。 

基于 专利 数据 进行 新 兴 技 术 识别 常会 将 专利 引用 
次 数 作为 专利 价值 的 衡量 指标 。 但 是 ,目前 很 多 学 者 
都 在 质疑 专利 被 引 次 数 是 否 能 真正 体现 专利 未 来 价值 
及 影响 力 ” 。 兰 德 公司 研究 报告 Identification and A- 
nalysis of Technology Emergence Using Patent Classifica- 
tion 中 也 明确 指出 专利 的 引用 与 其 价值 之 间 的 函数 关 


系 并 非 线 性 ,并 且 二 者 之 间 的 正 相关 性 也 没有 曾经 认 
为 的 那么 理想 ,该 研究 以 USPTO 的 专利 分 类 系统 和 相 
关 数 据 为 基础 ,通过 对 纳米 领域 专利 申请 数量 以 及 领 
域 相 关 技 术 分 类 数量 之 间 的 关系 随时 间 的 变化 进行 分 
Dr ,并 结合 S 曲线 识别 出 了 量子 点 技术 为 该 领域 的 新 
XER, 

基于 专利 数据 的 新 兴 技 术 识 别 也 常 采 用 专利 的 直 
引 ` 共 引 网 络 等 ,因此 也 常 与 社会 网 络 分 析 方 法 相 结 
合 。 例 如 ,P. C. Lee 等 ”在 专利 直 引 网 络 中 运用 社 
会 网 络 分 析 法 ,计算 度 中 心性 .中 介 中 心性 、 接 近 中 心 
性 用 于 表示 几 种 技术 演化 机 制 并 揭示 新 兴 技 术 ; 但 是 ， 
该 研究 中 展示 的 专利 引用 图 没有 考虑 时 间 跨 度 ,如果 
作者 能 够 建立 二 维 专利 引用 图 , 则 可 以 观察 领域 技术 
专利 随时 间 的 发 展 情况 ,这 样 就 能 够 更 好 地 识别 新 兴 
ER, T. S. Cho 等 ”也 将 专利 引用 网 络 与 社会 网 络 
分 析 相 结合 ,并 用 于 识别 台湾 技术 创新 体系 中 的 核心 
技术 和 新 兴 技 术 , 其 中 对 新 兴 技 术 的 识别 主要 采用 结 
构 洞 分 析 方 法 ,识别 出 了 5 项 跨越 不 同 专利 子 类 组 别 
并 有 机 会 与 其 他 专利 类 别 融 合 在 一 起 的 新 兴 技 术 。 李 
瑞 蔚 - 汪 以 中 国 大 陆 在 35 个 技术 领域 获得 中 国 授 权 的 
有 效 发 明 专 利 共 类 数据 为 样本 ,构建 了 非 对 称 的 技术 
知识 流 网 络 ,并 采用 社会 网 络 分 析 的 中 心 度 结构 洞 和 
中 间 人 分 析 方 法 ,探索 了 技术 关联 结构 特征 ,识别 了 技 
术 关 联网 络 的 核心 搁 术 、 中 介 技 术 和 新 兴 技 术 。 黄 璐 
等 中 利用 德 温 特 专利 数据 ,基于 加 权 共 词 网 络 进行 链 
路 预测 ,综合 考虑 网 络 局 部 、 路 径 以 及 随机 游 走 这 三 类 
网 络 结构 信息 ,构建 了 用 于 预测 技术 发 展 的 动态 网 络 ， 
并 围绕 新 突 性 与 影响 力 两 个 维度 识别 新 兴 技 术 , 最 后 
应 用 钙 钛 矿 材料 领域 相关 数据 进行 实证 分 析 ,部 分 结 
论 与 当前 学 术 界 的 共识 基本 保持 一 致 ,证 明了 该 方法 
的 有 效 性 。 到 目前 为 止 ,学 者 们 将 社会 网 络 分 析 法 用 
于 新 兴 技 术 识 别 中 时 所 采用 的 方法 和 指标 重合 度 较 
高 ,说 明 社 会 网 络 分 析 方 法 在 新 兴 技 术 识别 中 的 应 用 
较为 成 熟 ,但 是 就 不 同 指标 在 新 兴 技 术 识别 中 所 代表 
的 内 涵 及 其 与 新 兴 技 术 的 关联 还 有 待 进一步 阐释 。 

在 新 兴 技术 识别 中 ,对 专利 信息 的 可 视 化 也 不 仅 
仅 局 限于 计量 软件 对 引用 网 络 等 的 展示 ,学 者 们 将 专 
利 中 的 新 兴 主 题 的 可 视 化 进行 拓展 ,形成 各 类 专利 地 
图 。 例 如 ,S，Lee 等 “提出 了 一 种 基于 关键 词 创 建 专 
利 地 图 的 方法 ,首先 确定 专利 "空缺 , 即 地 图 中 专利 
密度 较 小 但 规模 较 大 的 空白 区 域 ,然后 对 专利 "空缺 ” 
的 有 效 性 进行 测试 , 即 计算 “空缺 ”中 专利 申请 的 增长 
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率 ,以 区 分 其 为 新 兴 技 术 还 是 正在 衰落 的 技术 。 但 是 ， 
目前 的 专利 信息 可 视 化 较 少 能 做 到 二 维 空间 的 映射 ， 
这 将 是 未 来 的 一 个 研究 方向 ,以 便于 更 好 地 观察 技术 
随时 间 的 发 展 变 化 ,以 此 确定 技术 的 发 展 潜力 。 

也 有 许多 学 者 不 断 对 专利 指标 进行 完善 和 拓展 ， 
以 提升 对 新 兴 技术 的 识别 效果 。 例 如 ,G，De Rassen- 
fosse 等 ” 为 了 解决 专利 数据 的 覆盖 面 问题 ,提出 了 一 
个 新 的 专利 指标 以 识别 新 兴 技 术 , 该 指标 对 一 个 国家 
发 明 人 提交 的 所 有 优先 专利 申请 进行 计数 ,而 不 论 提 
交 的 专利 局 是 哪 一 个 。 P，Erdi 等 "定义 了 一 种 称 为 
引文 向 量 的 预测 因子 来 表征 技术 发 展 ,引用 向 量 的 每 
个 坐标 与 该 专利 在 特定 时 间 内 被 特定 技术 类 别 中 的 其 
他 专利 所 引用 的 相对 频率 成 比例 ,并 以 引文 向 量度 量 
专 条 之 间 的 相似 性 ,在 专利 共 引 网 络 中 以 专利 相似 性 
嘲 类 得 出 新 兴 技 术 集群 ,并 观察 集群 结构 随时 间 的 动 
蕉 灾 化 以 识别 新 兴 技术 领域 ;但 是 ,该 方法 对 专利 引用 
网 乡 的 简化 以 及 对 引用 向 量 权重 设置 的 合理 性 还 有 待 
烛 步 验证 。 李 蓓 等 ”提出 了 一 种 基于 专利 引用 艳 
类 的 新 兴 技 术 识别 方法 ,并 选取 纳米 技术 领域 作 
为 研究 对 象 , 通 过 计算 技术 集群 的 专利 授权 时 间 .专利 
AAKE BUA BER TUB 3 个 指标 识别 出 了 
SPR SHARE 2 项 新 兴 技 术 ;但 是 ,该 方法 中 只 是 对 耦合 
连接 数 大 于 等 于 10 的 核心 专利 展开 了 聚 类 分 析 ,而 新 


SH 


“新 兴 集 群 ”, 以 此 识别 新 兴 技 术 ; 但 是 ,该 研究 中 对 下 
一 代 专 利 的 评分 机 制 包含 的 特征 指标 较为 局 限 , 仅 涉 
及 到 专利 元 数据 ,今后 的 研究 也 许可 增加 一 些 内 容 分 
析 的 指标 ,如 将 数据 范围 进一步 扩展 至 专利 摘要 等 的 
挖掘 分 析 , 可 能 有 利于 提升 方法 的 准确 性 。C. Lee 
等 ”也 提出 了 一 种 弱化 专利 数据 时 滞 性 的 方法 ,首先 
从 美国 专利 商标 局 数据 库 中 提取 出 18 个 技术 特征 指 
标 作 为 输入 指标 , 这 部 分 指标 可 在 相关 专利 发 布 后 立 
即 获取 数据 ,包括 技术 创新 级 别 、 技 术 范 围 .总体 技术 
实力 等 ,然后 再 提取 出 3 个 潜在 影响 力 指 标 作 为 输出 
指标 ,包括 未 来 3 年 5 年 10 年 内 的 被 引 次 数 ,通过 多 
层 前 馈 神经 网 络 捕获 输入 指标 和 输出 指标 之 间 的 非 线 
性 关系 ,以 该 非 线性 关系 预测 当前 专利 的 未 来 价值 ,并 
结合 两 个 定量 指标 “ emergingness” 和 “trend” 识别 新 兴 
技术 。 但 是 ,该 方法 也 还 存在 一 些 明 显 的 问题 :中 其 仅 
仅 采 用 了 专利 被 引 次 数 来 体现 专利 价值 ,显得 有 些 单 
薄 , 如 果 增 加 更 多 样 的 输出 指标 (如 专利 授权 量 、 专 利 
转让 价格 等 ) 加 强 技术 特性 与 未 来 影响 力 之 间 的 关系 
计算 与 研判 ,效果 可 能 会 更 好 一 些 ;@) 其 通过 神经 网 络 
计算 出 的 技术 特性 与 未 来 影响 力 之 间 的 非 线性 关系 缺 
乏 可 解释 性 ,应 该 对 此 给 出 科学 合理 的 论证 。 

总 体 而 言 ,专利 作为 技术 信息 的 重要 载体 ,能 更 好 
地 体现 技术 创新 层面 的 发 展 动向 ,但 是 由 于 专利 审核 


兴 本 术 刚刚 萌芽 时 ,可 能 与 已 存在 的 技术 间 联 系 会 非 
常 哎 ,因此 ,该 方法 很 可 能 会 忽略 掉 -一 些 尚 处 于 萌芽 期 
的 狼 兴 前 沿 技 术 信息 。C，Kim 等 中 也 提出 了 类 似 的 
用 铬 识别 新 兴 技 术 的 专利 指标 化 计算 方法 。 

一 然而 , 相 比 于 科学 论文 数据 ,专利 数据 的 时 灌 性 问 
题 更 为 严重 。 为 了 弱化 这 一 问题 的 影响 ,一 些 学 者 探 
索性 地 提出 了 运用 专利 数据 时 提高 新 兴 技术 识别 时 效 
性 的 方法 。 例 如 ,CG，De Rassenfosse 等 中 提出 了 一 个 
用 以 识别 新 兴 技 术 的 指标 ,通过 对 一 个 国家 发 明 人 提 
交 的 所 有 优先 专利 申请 进行 计数 ,该 指标 捕捉 的 是 申 
请 的 专利 ,而 不 是 授予 的 专利 ,因此 在 一 定 程度 上 保证 
了 专利 数据 的 及 时 性 ;但 是 ,这 里 又 会 引发 另外 一 个 问 
题 , 即 还 未 获得 授权 的 专利 质量 可 能 又 难以 保证 。A. 
Breitzman 等 5 则 提出 基于 Emerging Clusters 模型 来 近 
乎 实时 地 而 非 回顾 性 地 定位 新 兴 技 术 ,首先 确定 给 定 
时 间 段 内 的 热门 专利 ,然后 识别 出 引用 热门 专利 的 下 
一 代 专利 并 进行 聚 类 形成 专利 集群 ,再 通过 专利 集 条 
的 4 个 特征 (公共 部 门 比例 .科学 指数 .原创 指数 .参考 
指数 ) 对 其 进行 评分 和 排名 ,其 中 得 分 最 高 的 被 定义 为 


周期 较 长 等 原因 ,其 用 于 新 兴 技 术 识 别 的 时 灌 性 也 较 
为 严重 ,因而 专利 作为 新 兴 技 术 识 别 中 应 用 最 广泛 的 
数据 源 ,在 今后 的 研究 中 如 何 尽 可 能 地 降低 其 时 滞 性 
对 预测 结果 的 影响 将 是 一 个 值得 关注 的 问题 。 
2.2.3 基于 论文 与 专利 数据 融合 计算 的 新 兴 技 术 识 
别 方法 

H. M. Jarvenpaa 等 认为 关于 技术 预测 的 最 常 
见 的 批评 之 一 就 是 使 用 单一 数据 库 作 为 数据 来 源 , 应 
该 使 用 不 同 来 源 的 数据 以 克服 单一 来 源 数 据 可 能 导致 
的 偏见 。 而 新 兴 技 术 识 别 领 域 的 大 多 数 研 究 都 选择 了 
单一 数据 源 ( 专利 数据 或 论文 数据 ) , 仅 有 个 别 学 者 将 
论文 .专利 数据 结合 起 来 进行 分 析 。 例 如 , 王 凌 燕 
等 .| 尝试 建立 了 一 套 新 兴 技 术 主 题 判 定 评价 指标 体 
系 ,包括 3 类 文献 计量 指标 ( 主题 词 词 频 的 变化 指标 、 
战略 坐标 图 指标 和 共 词 网 络 指标 ) 和 4 个 专利 特征 指 
标 (专利 申请 量 增长 率 、 技 术 生 长 率 、 专 利家 族 平均 成 
员 数 变化 、 专 利他 引 率 ) ,通过 文本 聚 类 技术 . 共 词 战略 
坐标 分 析 、 共 词 网 络 分 析 、 专 利 分 析 等 共同 识别 出 了 工 
业 生 物 领 域 的 新 兴 技 术 , 并 通过 咨询 相关 领域 专家 、 对 
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国家 相关 政策 及 相关 技术 项 目 资金 投入 情况 对 识 另 
吉 果 的 有 效 性 进行 了 检验 。 同 样 地 ,T，Ogawa 等 ” 首 
E 通 过 限 类 燃料 电池 领域 学 术 论 文 的 引文 网 络 来 确定 
子 研究 领域 ,然后 通过 测量 和 分 析 子 研究 领域 的 专利 
相关 性 和 时 间 序 列 变化 以 识别 该 领域 的 新 兴 技 术 ,并 
选择 国体 高 分 子 型 燃料 电池 (PEFC ) 进行 了 验证 , 结 
表明 ,在 一 个 论文 数量 较 少 ,平均 出 版 年 份 较 近 专利 
相关 性 较 低 的 技术 领域 ,其 随后 几 年 很 可 能 会 有 较 大 
的 发 展 潜力 。 

越 来 越 多 的 研究 表明 ,将 论文 与 专利 数据 相 结 合 
进行 分 析 , 虽 然 可 能 会 在 一 定 程度 上 增加 分 析 工 作 旱 ， 
但 由 于 不 同 数 据 源 之 间 可 以 互 为 补充 ,有 利于 减少 因 
为 使 用 单一 数据 源 所 带 来 的 分 析 误 差 。 进 一 步 地 ,也 
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项 目 数 据 \ 商 业 报 道 数据 等 ) ,通过 多 源 数据 的 融合 计 
竹 涟 行 新 兴 技术 的 识别 ,这 种 新 型 方法 也 许 能 够 带 来 
更 姓 的 识别 效果 。 但 是 因为 多 源 数据 的 多 层次 、 多 类 
器 对 其 进行 有 效 融 合 难度 较 大 ; 同时 ,对 分 析 数据 
集 事 各 数据 源 数 据 的 比例 设置 问题 也 缺乏 标准 ,仅仅 
是 对 论文 与 专利 数据 的 融合 方面 尚且 缺乏 深入 探 
HES ,部 分 学 者 在 基于 多 源 数据 融合 计算 识别 新 兴 
相 邓 面 进行 了 一 些 实践 性 探索 ,但 对 其 中 的 机 理 研究 


™ 


还 这 远 不 够 。 徐 路 路 等 59 认为 进行 多 数据 源 融合 的 


相 美 以 及 情景 相关 ,作者 选取 论文 数据 、 基 金 项 目 数 
据 $ 专 利 数据 3 种 数据 源 进行 相关 性 分 析 , 并 基于 PL- 
DA 主题 模型 对 多 源 文本 的 摘要 信息 进行 融合 计算 , 识 
别 出 了 石墨 烯 领域 的 4 个 新 兴 技 术 主题 ;但 是 ,该 研究 


对 多 源 数 据 的 融合 力度 还 有 所 不 足 , 仅 仅 是 简单 融合 
了 多 源 文 本 的 摘要 数据 ,未 来 还 可 以 研究 针对 不 同 数 
据 源 的 评价 指标 体系 ,并 通过 参数 设置 真正 实现 多 源 
文本 主题 信息 的 深度 挖 据 与 融合 计算 。 
2.3 ”基于 文本 挖掘 分 析 的 新 兴 技 术 识别 方法 

随 着 文本 挖 据 技术 的 发 展 ,将 文本 挖 据 分 析 方 法 
应 用 于 新 兴 技 术 识 别 也 是 目前 日 益 热 门 的 研究 点 之 
一 。 目 前 其 在 新 兴 技 术 识别 中 的 应 用 主要 是 挖掘 科学 
论文 或 专利 的 语义 信息 ,最 常用 的 两 种 方法 分 别 是 基 
于 主题 模型 的 方法 和 基于 结构 语义 分 析 的 方法 。 基 于 
主题 模型 的 方法 主要 用 以 对 领域 技术 主题 及 相关 术语 
进行 分 类 ,基于 结构 语义 的 方法 主要 用 以 定义 及 提取 
新 兴 技 术 关 键 词 。 总 之 ,文本 挖掘 分 析 方 法 应 用 于 新 


兴 技 术 识别 是 对 新 兴 技 术 识 别 流程 与 技术 方法 的 重大 
改进 ,能 够 高 通 量 地 ,高 效 地 处 理 海量 科学 文献 及 专利 
数据 ,减少 人 工 筛选 处理 数 据 的 繁琐 。 
2.3.1 基于 主题 模型 的 方法 

主题 模型 是 以 非 监督 学 习 的 方式 对 文档 的 隐 含 语 
义 结构 进行 聚 类 统计 。 新 兴 技 术 识 别 中 最 常见 的 
主题 模型 就 是 LDA 主题 模型 ,其 将 每 一 篇 文档 表示 为 
一 些 主题 所 构成 的 一 个 概率 分 布 ,而 每 一 个 主题 又 被 
表示 为 很 多 词 所 构成 的 一 个 概率 分 布 ,以 此 构建 文档 
与 技术 主题 之 间 的 关系 ,从 而 识别 领域 内 技术 主题 并 
进行 分 类 。 例 如 , 任 智 军 等 ”采用 LDA 模型 获取 技术 
主题 ,并 通过 特征 向 量 与 Gartner 的 新 兴 技 术 主 题 进行 
相似 度 计算 ,通过 设 定 相 似 度 国 值 , 遂 选 出 有 限 个 技术 
主题 交 给 专家 进行 判定 ,该 方法 减少 了 专家 的 主观 性 
和 待 分 析 新 兴 技 术 的 数量 ,提高 了 专家 的 工作 效率 。 
董 放 等 则 通过 LDA 主题 模型 和 SVM (支持 向 量 机 ) 
分 类 模型 共同 处 理论 文摘 要 数据 ,实现 对 论文 按照 技 
术 主 题 的 分 类 ,并 用 ARIMA 模型 预测 技术 领域 未 来 论 
文 数量 的 变化 趋势 ,从 而 识别 技术 领域 发 展 潜力 。D. 
Choi 等 ”基于 LDA 主题 模型 确定 领域 主题 及 相关 术 
语 , 之 后 通过 计算 每 个 主题 当前 的 专利 份额 以 及 该 主 
题 专利 份额 随时 间 的 变化 率 ,识别 出 物流 领域 4 种 不 
同 的 技术 主题 (主导 主题 ,新 兴 主 题 , 饱 和 主题 和 衰退 
主题 ) 。 

因为 LDA 主题 模型 是 典型 的 无 监督 机 器 学 习 , 结 
SRT PE PERRO? ,因此 有 学 者 开始 使 用 有 监督 机 器 学 
习 方法 ,以 提高 主题 模型 对 技术 分 类 的 准确 性 。 有 监 
督学 习 与 无 监督 学 习 的 本 质 差别 在 于 有 监督 学 习 必 须 
有 标签 。 例 如 , 周 源 等 提出 了 一 种 基于 机 器 学 习 主 
题 模 型 的 新 兴 技 术 识 别 方法 ,将 专家 组 的 领域 知识 与 
判断 融入 机 器 学 习 过 程 中 ,从 而 提高 了 机 器 学 习 主题 
模型 的 准确 度 与 识别 新 兴 技 术 的 能 力 。 其 后 , 周 源 
等 ”在 此 基础 上 进一步 完善 了 该 方法 ,其 基于 半 监 督 
主题 聚 类 模型 ,从 词 级 技术 主题 语义 描述 上 升 至 句 级 
技术 主题 语义 描述 , 即 以 句子 的 形式 描述 技术 主题 聚 
类 结果 ,进一步 加 强 了 技术 语义 解释 能 

技术 主题 的 筛选 与 分 类 更 进一步 则 是 技术 术语 的 
筛选 与 分 类 ,是 对 技术 主题 的 一 致 化 ,规范 化 处 理 ,是 
作为 新 兴 技术 识别 预测 前 期 工作 的 进一步 深化 。 刘 字 
飞 等 中 认为 专利 文献 是 技术 情报 最 为 重要 的 来 源 ,但 
是 由 于 新 兴 技 术 缺 乏术 语 标签 ,对 其 挖掘 及 抽取 难度 
较 大 ,因此 引入 深度 迁移 学 习 的 思想 ,首先 抽取 专利 摘 
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要 ,通过 引入 专家 知识 构建 标签 语 库 ,然后 提取 标签 特 
征 ,通过 Bi-LSTM 模型 实现 源 数据 特征 的 迁移 学 习 , 最 
后 针对 输出 结果 ,通过 聚 类 分 析 , 结 合 专家 判断 ,将 技术 
术语 划分 技术 类 别 , 该 模型 有 效 实现 了 技术 术语 自动 识 
别 并 过 滤 高 频 非 术语 词 串 , 且 其 恰当 结合 了 专家 知识 ， 
进一步 保证 了 识别 结果 的 有 效 性 ,其 技术 分 类 结果 也 有 
利于 研究 人 员 对 新 兴 技 术 做 进一步 的 识别 及 预测 ,这 也 
是 深度 学 习 在 新 兴 技 术 识别 中 运用 的 典型 案例 。 

总 之 ,基于 主题 模型 的 机 器 学 习 方法 并 非 真正 用 
于 “识别 "新 兴 技 术 , 而 是 对 新 兴 技 术 相关 主题 及 术语 
进行 前 期 处 理 ,包括 筛选 与 分 类 ,其 极 大 地 降低 了 新 兴 
技术 识别 中 的 人 工 成 本 。 但是,“ 新 兴 技 术 ” 由 于 其 新 
颖 性 和 模糊 性 的 特征 ,完全 依赖 算法 的 识别 方法 也 显 
律 沉 服 力 不 足 ,因此 ,还 应 该 适当 结合 专家 意见 ,做 到 
性 客 观 相 结合 ,以 提高 新 兴 技 术 识别 的 准确 性 。 
基于 结构 语义 分 析 的 方法 
刁 因 为 新 兴 技术 术语 还 不 具备 完全 的 一 致 性 与 规范 
愉 商 此 有 效 定义 及 提取 新 兴 技 术 领 域 的 关键 词 是 一 
项 坪 难 的 任务 ,甚至 对 专家 来 说 也 是 如 此 ”* 。 而 基 
玉 唇 构 语义 的 方法 应 用 于 新 兴 技 术 识别 时 ,最 大 的 优 
5 神 于 能 够 自动 提取 专利 的 属性 功能、 关联 关系 等 ， 
人 Ed 定 程度 上 消除 或 弱化 了 上 述 问题 。 


>> 基 于 结构 语义 的 分 析 方 法 在 新 兴 技 术 识别 中 的 应 


揭 呆 技术 主题 之 间 的 关联 关系 等 问题 ,提出 了 基于 
SAO 结构 语义 分 析 法 的 新 兴 技术 识别 模型 ,首先 抽取 
专利 权利 要 求 项 中 的 SAO 结构 ,再 利用 改进 的 语义 相 
似 度 算法 对 专利 文本 进行 聚 类 ,最 后 结合 基于 时 间 切 
片 的 专利 地 图 识别 新 兴 技 术 , 并 以 钙 钛 矿 太 阳 能 电池 
技术 为 例 进行 了 实证 研究 ,验证 了 该 模型 的 可 行 性 和 
有 效 性 。 随 后 , C，Yang 等 “又 提出 了 一 种 改进 的 
SAO 网 络 ,该 网 络 可 计算 节点 之 间 的 关系 强度 ,并 结合 
社会 网 络 分 析 方 法 ,基于 结构 洞 .节点 度数 分 布 变化 、 
网 络 中 心 度 变 化 等 进行 特定 领域 新 兴 技 术 识别 及 其 发 
展 趋势 的 预测 ,并 以 石墨 烯 技术 领域 进行 了 实证 研究 ， 
验证 了 其 方法 的 有 效 性 。 

也 有 学 者 将 SAO 结构 语义 分 析 法 与 TRIZ 理论 相 
结合 识别 新 兴 技 术 。 例 如 , 翟 东 升 等 “在 TRIZ 理论 
基础 上 ,通过 SAO-C 结构 语义 分 析 法 抽取 专利 语义 特 
PEDRE” “ZU” “DRC 以 及 非 语义 特征 “申请 机 


构 ”, 通 过 “功能 + 效应 ”信号 组 合 锁定 潜在 弱 信 号 ,并 
通过 申请 机 构 .申请 时 间 功效 进一步 识别 新 兴 抠 术 弱 
信号 ,最 后 应 用 该 方法 识别 出 了 “隐形 眼镜 消毒 "领域 
的 潜在 新 兴 技 术 。 

事实 上 , 现 有 研究 较为 缺乏 对 技术 发 展 内 在 动力 
与 其 发 展 趋势 之 间 关 系 的 解读 ” 。 而 技术 发 展 的 内 
在 动力 主要 涉及 市 场 需求 方面 ,包含 问题 解决 .功能 实 
现 等 表征 因素 ,这 些 数据 可 以 通过 专家 意见 获取 ,但 也 
可 以 通过 结构 语义 分 析 方 法 从 专利 文献 甚至 科技 评论 
中 自动 获取 ,这 可 以 大 幅度 地 降低 主观 性 、 节 省 人 力 物 
力 , 更 好 地 识别 技术 未 来 发 展 潜力 ,因此 在 当前 可 供 使 
用 的 数据 源 及 其 中 可 挖掘 的 信息 不 断 增 多 的 背景 下 ， 
基于 结构 语义 分 析 的 新 兴 技 术 识别 方法 具有 较 大 的 研 
究 价 值 。 


3 结语 


自 宾夕法尼亚 大 学 沃 顿 商学 院 2000 年 出 版 著作 
Wharton on Managing Emerging Technologies 后 ,新 兴 技 
术 识 别 一 直 都 是 学 者 们 关注 的 热点 ”。 目 前 的 新 兴 
术 识 别 研究 整体 呈现 如 下 特征 : 

(1) 新 兴 技 术 识别 越 来 越 受 到 各 领域 .各 层面 机 
构 的 关注 和 重视 ,并 从 各 自 目 的 出 发 组 织 开 展 了 诸多 
的 新 兴 技 术 识别 活动 。 在 国家 层面 进行 的 新 兴 技 术 识 
别 其 目的 在 于 加 强国 家 科技 战略 规划 和 整体 科研 布局 
的 科学 性 ,在 企业 层面 进行 的 新 兴 技 术 识 别 其 目的 在 
于 确定 企业 技术 研发 重点 及 投资 方向 ,研究 机 构 进行 
的 新 兴 技 术 识 别 其 目的 在 于 寻找 未 来 科研 方向 和 支持 
做 好 科研 的 前 瞻 布 局 。 新 兴 技 术 识 别 在 相关 科技 战略 
决策 中 日 益 发 挥 着 重要 的 支撑 作用 。 

(2) 不 同 层面 的 研究 主体 识别 新 兴 技 术 的 目的 有 
所 不 同 , 相 应 的 ,其 所 采取 的 方法 也 有 所 差异 , 即 不 同 
的 新 兴 技 术 识 别 方法 有 不 同 的 应 用 场景 。 

(3) 近 年 来 ,新 兴 技 术 识 别 预测 方法 的 研究 热度 
不 断 上 升 ,其 中 ,文献 计量 及 专利 分 析 是 应 用 最 为 广泛 
的 方法 ,而 机 器 学 习 文本 挖掘 等 方法 在 其 中 的 应 用 近 
几 年 发 展 尤为 迅速 ,深度 学 习 方法 也 开始 在 新 兴 技 术 
识别 预测 领域 皆 露 头角 。 

总 之 ,近年 来 新 兴 技 术 识别 领域 在 指标 体系 设计 、 
模型 构建 ,算法 运用 等 方面 都 产生 了 较 多 的 创新 性 成 
果 , 但 是 目前 该 领域 的 研究 依然 存在 一 些 不 足 , 具 体 如 
下 : 

(1) 缺乏 对 新 兴 技 术 本 质 特 征 的 研究 ,导致 研究 
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ER, RHE. 新 兴 技 术 识 别 方法 研究 综述 [J]. 图 书 情报 工作 ,2020 ,64(4) :125 -135. 


针对 性 不 足 。 目 前 的 研究 多 的 是 探索 引进 和 应 用 一 些 
新 的 技术 方法 ,以 期 不 断 改进 新 兴 技 术 发 现 与 识别 的 
效果 ,但 由 于 对 新 兴 技 术 本 质 特征 的 研究 不 足 , 因 而 常 
常 导致 方法 层面 的 改进 效果 总 是 欠 佳 。 

(2) 具 体 识别 方法 对 新 兴 技 术 识 别 的 解释 意义 不 
强 。 目 前 的 新 兴 技 术 识别 方法 中 除了 个 别 特征 性 指标 
NO 《技术 识别 
的 关联 解释 ,而 抽象 的 数学 模型 等 在 这 方面 的 问题 则 
更 为 突出 。 

(3) 数 据 时 效 性 制约 问题 还 没有 得 到 有 效 解决 。 
目前 ,在 新 兴 技 术 识 别 领域 的 研究 更 多 停留 在 “回顾 性 
研究 ”层面 ,这 与 数据 源 及 方法 的 选取 两 方面 因素 都 有 
关联 。 在 数据 源 方面 ,虽然 当前 可 用 的 数据 源 更 为 多 
是 学 者 们 在 实际 研究 中 基本 只 选取 了 论文 及 专 
和 次 据 ,而 论文 及 专利 数据 的 时 洁 性 却 是 难以 回避 的 


cM 


HF 


o 


O 〇 (4) 缺乏 对 多 源 数据 有 效 融合 方 法 的 探索 。 虽然 
背 介 多 学 者 提 到 ,通过 多 源 数据 融合 计算 识别 新 兴 技 
可 能 会 更 好 的 识别 效果 ,但 是 目前 在 这 方面 进行 
深 内 探索 的 学 者 相对 较 少 ,原因 在 于 多 源 数据 的 有 交 
本 办 难度 较 大 , 目 缺 乏 专 业 理论 指导 和 机 理性 研究 成 


加 
| € 


前 新 兴 技术 识别 研究 领域 的 不 足 ,未 来 研 
WE 行 加 强 : 


外 (0) 加强 对 新 兴 技术 本 质 特征 的 研究 ,构建 更 为 
完 杜 的 新 兴 技 术 识别 标准 体系 ,使 得 新 兴 技术 的 识 另 别 
BEALE ATER BEI o 

eri alld seed ate 《技术 的 解释 性 ,更 
好 地 搭建 “识别 方法 -结果 解读 ”的 桥梁 。 

(3 ) 努力 克服 数据 时 效 性 的 制约 。 在 数据 层面 ， 
一 步 挖 据 其 他 数据 源 的 价值 和 可 用 性 ,充分 利用 当 
前 数据 处 理 方法 的 高 效 性 及 便捷 性 ,发 挥 各 类 数据 的 
优势 ,提高 新 兴 技 术 识别 的 效率 与 准确 度 ;在 方法 层 
面 , 通 过 优化 指标 选取 尽量 地 弱化 专利 等 数据 的 时 滞 
性 问题 ,以 更 好 得 强化 分 析 结 果 的 决策 支撑 价值 。 

(4) 加 强 对 多 源 数 据 融合 计算 的 理论 与 方法 的 深 
入 探索 ,从 而 为 新 兴 技 术 识别 甚至 整个 技术 预测 领域 


开启 新 的 通道 
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Research on Identification Methods of Emerging Technologies 
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University of Chinese Academy of Sciences , Beijing 100049 
Abstract: | Purpose/significance | The paper systematically analyzes the identification methods of emerging 
technologies at home and abroad, then summarizes research status and analyzes existing problems to provide reference 
for future research on identification methods of emerging technologies. | Method/process | On the basis of literature 
research and bibliometric analysis, this paper summarized the current mainstream identification methods of emerging 
technologies and analyzed its characteristics and its impact on the research of identification methods of emerging tech- 
Tages combined with typical cases , then proposed suggestions for future research on identification methods of emer- 
‘Bing technologies. | Result/conclusion | The current identification methods of emerging technologies conclude quan- 
“itive methods and qualitative methods. The common identification methods of emerging technologies are mainly 
(based on measurement models, bibliometrics and text mining methods, and they are increasingly inclined to be multi 
号 :oa fusion. However, there are still some deficiencies in the research. Future research on identification methods 
Qf emerging technologies should strengthen the exploration of the essential characteristics of emerging technologies, 
Cand strengthen the interpretation of specific identification methods to emerging technologies, and promote the timeli- 
So of identification of emerging technologies from data sources and identification methods as well as Strengthen the 
Céxploration of effective fusion methods and application methods of multi -source data in the identification of emerging 
Ninologies. 
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